智能论文笔记

LOTR: Face Landmark Localization Using Localization Transformer

Ukrit Watchareeruetai , Benjaphan Sommana , Sanjana Jain , Pavit Noinongyao , Ankush Ganguly , Aubin Samacoits , Samuel W. F. Earp , Nakarin Sritrakool

分类：计算机视觉 | 人工智能 | 机器学习

2021-09-21

本文提出了一种名为定位变压器（LOTR）的新型变压器的面部地标定位网络。所提出的框架是一种直接坐标回归方法，利用变压器网络以更好地利用特征图中的空间信息。 LOTR模型由三个主要模块组成：1）将输入图像转换为特征图的视觉骨干板，2）改进Visual Backone的特征表示，以及3）直接预测的地标预测头部的变压器模块来自变压器的代表的地标坐标。给定裁剪和对齐的面部图像，所提出的LOTR可以训练结束到底，而无需任何后处理步骤。本文还介绍了光滑翼损失功能，它解决了机翼损耗的梯度不连续性，导致比L1，L2和机翼损耗等标准损耗功能更好地收敛。通过106点面部地标定位的第一个大挑战提供的JD地标数据集的实验结果表明了LOTR在排行榜上的现有方法和最近基于热爱的方法的优势。在WFLW DataSet上，所提出的Lotr框架与若干最先进的方法相比，展示了有希望的结果。此外，我们在使用我们提出的LOTRS面向对齐时，我们报告了最先进的面部识别性能的提高。

translated by 谷歌翻译

我们介绍树-AMP，站在树近似消息传递，用于高维树结构模型的组成推理的Python包。该包提供统一框架，用于研究以前导出的多种机器学习任务的几种近似消息传递算法，例如广义线性模型，多层网络的推断，矩阵分解和使用不可惩罚的重建。对于某些型号，可以通过状态进化理论上预测算法的渐近性能，并通过自由熵形式主义估计的测量熵。通过设计模块化：实现因子的每个模块可以与其他模块一起组成，以解决复杂的推理任务。用户只需要声明模型的因子图：推理算法，状态演化和熵估计是完全自动化的。

translated by 谷歌翻译